#destilación de conocimiento

Destilación adaptativa con heterofilia para redes neuronales de hipergrafos

HADES usa la heterofilia para destilar conocimiento en hipergrafos. Logra modelos ligeros hasta 12.3 veces más rápidos que el profesor.

2026-06-09 · 1 min

Estabilizando destilación on-policy para razonamiento MLLM

Descubre cómo la normalización global estabiliza la destilación on-policy en modelos multimodales, mejorando el razonamiento y evitando explosiones de gradiente.

2026-06-09 · 2 min

AliyunConsoleAgent: agentes web en cloud real con destilación y refuerzo

AliyunConsoleAgent entrena agentes web para verificar documentación en consolas cloud. Combina destilación y RL, logrando 63.52% éxito con 92% menos costo.

2026-06-09 · 3 min

Caracterizar y luego destilar: razonamiento mecanicista en grandes espacios

Aprende cómo los modelos de razonamiento seleccionan entre millones de etiquetas usando una estrategia de destilación mecanicista en dos fases.

2026-06-08 · 2 min

Destilación de Conocimiento Adelante-Atrás en Clustering Continuo No Supervisado

Descubre cómo el nuevo método FBCC evita el olvido catastrófico en clustering continuo sin etiquetas usando destilación adelante-atrás.

2026-06-08 · 2 min

Clustering Continuo No Supervisado con Destilación Bidireccional

Aprende cómo FBCC aplica destilación bidireccional para clustering continuo sin olvidar tareas anteriores. Reduce el olvido catastrófico.

2026-06-08 · 2 min

LRMIL: Aprendizaje eficiente en baja resolución para clasificación patológica

Aprende cómo LRMIL destila conocimiento de alta resolución a baja para clasificar imágenes patológicas con alta precisión y bajo coste.

2026-06-08 · 2 min

Planificación espacial visual con autodestilación de brecha de modalidad

MGSD mejora la planificación espacial visual un 19% mediante autodestilación consciente de brecha de modalidad, cerrando la brecha percepción-razonamiento.

2026-06-06 · 2 min

LoRi: Destilación de Bajo Rango para Razonamiento Implícito

Descubre LoRi: destilación de bajo rango que mejora el razonamiento implícito en LLMs, acercándose a cadenas de pensamiento explícitas.

2026-06-06 · 2 min

Drive-KD: Destilación multi-profesor para VLMs en conducción autónoma

Drive-KD destila conocimiento multi-profesor para VLMs en conducción autónoma: menor uso de GPU, mayor throughput y rendimiento superior en planificación.

2026-06-06 · 2 min

ViCuR: Pistas visuales como privilegio recuperable en destilación multimodal

ViCuR usa pistas visuales recuperables para destilación on-policy multimodal, mejorando razonamiento sin sesgos de atajos. Resultados mejores en benchmarks.

2026-06-05 · 3 min

Compress-Distill: comprimir trazas para destilar conocimiento

Comprime trazas de razonamiento para destilar conocimiento. Reduce tokens de entrenamiento hasta 70% y acelera 7.6x con hasta 96% de precisión.

2026-06-05 · 2 min

Recover-LoRA: Recuperando precisión en cuantización agresiva de 2 bits

Recover-LoRA recupera hasta 95% de precisión en modelos de 2 bits usando adaptación de bajo rango y destilación con solo 10k datos sintéticos.

2026-06-04 · 2 min

Recover-LoRA: Recuperando precisión en modelos de 2 bits

Recover-LoRA recupera hasta un 95% de precisión en modelos de lenguaje cuantizados a 2 bits usando destilación de conocimiento con datos sintéticos. Ideal para despliegue en edge.

2026-06-04 · 2 min

Destilación Geométrica para Ajuste de Prompts en Modelos Biomédicos

Descubre cómo OGKD mejora la precisión en modelos médicos al respetar relaciones entre clases. Resultados superiores en 11 datasets.

2026-06-04 · 2 min

PRISM: Integración de Modelos de Visión con Expertos Autoorganizados

PRISM combina modelos de visión fundacionales con expertos autoorganizados, superando la transferencia negativa para lograr el estado del arte en segmentación.

2026-06-03 · 1 min

Modelos de lenguaje: dormir para auto-modificarse y consolidar recuerdos

Descubre cómo los modelos de lenguaje pueden mejorar su memoria y aprender de forma continua imitando el sueño humano, con técnicas de destilación y ensueño.

2026-06-03 · 3 min

Align-KD: destilando conocimiento de alineación multimodal para VLMs móviles

Descubre Align-KD, técnica que destila conocimiento de alineación multimodal de VLMs grandes a modelos móviles, mejorando precisión en 6 benchmarks.

2026-06-03 · 2 min

Destilar luego Reemplazar: Modelos Híbridos de Atención Eficientes

DtR transforma transformers preentrenados en modelos híbridos eficientes mediante destilación y reemplazo de capas. Obtén precisión con menor costo computacional.

2026-06-03 · 1 min

PAND: Destilación de Vecindad Consciente de Prompts en Clasificación Visual Fina

Descubre PAND: destilación de vecindad consciente de prompts para clasificación visual fina. Supera al estado del arte con modelos ligeros.

2026-06-03 · 3 min